FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1822, 335 aa 1>>>pF1KE1822 335 - 335 aa - 335 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.0098+/-0.000727; mu= 18.3093+/- 0.044 mean_var=72.0317+/-14.523, 0's: 0 Z-trim(109.6): 67 B-trim: 0 in 0/51 Lambda= 0.151117 statistics sampled from 10920 (10991) to 10920 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.712), E-opt: 0.2 (0.338), width: 16 Scan time: 2.830 The best scores are: opt bits E(32554) CCDS1173.1 CD1D gene_id:912|Hs108|chr1 ( 335) 2320 514.6 4.4e-146 CCDS41417.1 CD1E gene_id:913|Hs108|chr1 ( 388) 1226 276.2 3.1e-74 CCDS41418.1 CD1E gene_id:913|Hs108|chr1 ( 376) 1212 273.1 2.5e-73 CCDS1174.1 CD1A gene_id:909|Hs108|chr1 ( 327) 1165 262.8 2.7e-70 CCDS1176.1 CD1B gene_id:910|Hs108|chr1 ( 333) 1143 258.0 7.7e-69 CCDS1175.1 CD1C gene_id:911|Hs108|chr1 ( 333) 1098 248.2 6.9e-66 CCDS41421.1 CD1E gene_id:913|Hs108|chr1 ( 290) 962 218.5 5.3e-57 CCDS53387.1 CD1E gene_id:913|Hs108|chr1 ( 289) 939 213.5 1.7e-55 CCDS41419.1 CD1E gene_id:913|Hs108|chr1 ( 321) 833 190.4 1.7e-48 CCDS53385.1 CD1E gene_id:913|Hs108|chr1 ( 298) 674 155.7 4.3e-38 CCDS53390.1 CD1E gene_id:913|Hs108|chr1 ( 199) 663 153.2 1.7e-37 CCDS53386.1 CD1E gene_id:913|Hs108|chr1 ( 286) 660 152.7 3.4e-37 CCDS41420.1 CD1E gene_id:913|Hs108|chr1 ( 187) 649 150.1 1.3e-36 CCDS41422.1 CD1E gene_id:913|Hs108|chr1 ( 101) 399 95.4 2.1e-20 CCDS75412.1 HFE gene_id:3077|Hs108|chr6 ( 337) 342 83.4 2.9e-16 CCDS4578.1 HFE gene_id:3077|Hs108|chr6 ( 348) 342 83.4 3e-16 CCDS47387.1 HFE gene_id:3077|Hs108|chr6 ( 325) 340 82.9 3.8e-16 CCDS1342.1 MR1 gene_id:3140|Hs108|chr1 ( 341) 329 80.6 2.1e-15 CCDS12770.1 FCGRT gene_id:2217|Hs108|chr19 ( 365) 308 76.0 5.2e-14 CCDS5680.1 AZGP1 gene_id:563|Hs108|chr7 ( 298) 303 74.9 9.5e-14 CCDS4580.1 HFE gene_id:3077|Hs108|chr6 ( 260) 299 73.9 1.6e-13 CCDS53384.1 CD1E gene_id:913|Hs108|chr1 ( 231) 292 72.4 4.1e-13 CCDS34394.1 B gene_id:3106|Hs108|chr6 ( 362) 282 70.3 2.6e-12 CCDS53389.1 CD1E gene_id:913|Hs108|chr1 ( 132) 270 67.4 7.5e-12 CCDS53388.1 CD1E gene_id:913|Hs108|chr1 ( 144) 270 67.4 8.1e-12 CCDS34393.1 C gene_id:3107|Hs108|chr6 ( 366) 262 66.0 5.5e-11 CCDS34379.1 E gene_id:3133|Hs108|chr6 ( 358) 260 65.5 7.3e-11 CCDS34373.1 A gene_id:3105|Hs108|chr6 ( 365) 258 65.1 1e-10 >>CCDS1173.1 CD1D gene_id:912|Hs108|chr1 (335 aa) initn: 2320 init1: 2320 opt: 2320 Z-score: 2736.1 bits: 514.6 E(32554): 4.4e-146 Smith-Waterman score: 2320; 100.0% identity (100.0% similar) in 335 aa overlap (1-335:1-335) 10 20 30 40 50 60 pF1KE1 MGCLLFLLLWALLQAWGSAEVPQRLFPLRCLQISSFANSSWTRTDGLAWLGELQTHSWSN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MGCLLFLLLWALLQAWGSAEVPQRLFPLRCLQISSFANSSWTRTDGLAWLGELQTHSWSN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 DSDTVRSLKPWSQGTFSDQQWETLQHIFRVYRSSFTRDVKEFAKMLRLSYPLELQVSAGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 DSDTVRSLKPWSQGTFSDQQWETLQHIFRVYRSSFTRDVKEFAKMLRLSYPLELQVSAGC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 EVHPGNASNNFFHVAFQGKDILSFQGTSWEPTQEAPLWVNLAIQVLNQDKWTRETVQWLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 EVHPGNASNNFFHVAFQGKDILSFQGTSWEPTQEAPLWVNLAIQVLNQDKWTRETVQWLL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 NGTCPQFVSGLLESGKSELKKQVKPKAWLSRGPSPGPGRLLLVCHVSGFYPKPVWVKWMR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 NGTCPQFVSGLLESGKSELKKQVKPKAWLSRGPSPGPGRLLLVCHVSGFYPKPVWVKWMR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 GEQEQQGTQPGDILPNADETWYLRATLDVVAGEAAGLSCRVKHSSLEGQDIVLYWGGSYT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GEQEQQGTQPGDILPNADETWYLRATLDVVAGEAAGLSCRVKHSSLEGQDIVLYWGGSYT 250 260 270 280 290 300 310 320 330 pF1KE1 SMGLIALAVLACLLFLLIVGFTSRFKRQTSYQGVL ::::::::::::::::::::::::::::::::::: CCDS11 SMGLIALAVLACLLFLLIVGFTSRFKRQTSYQGVL 310 320 330 >>CCDS41417.1 CD1E gene_id:913|Hs108|chr1 (388 aa) initn: 1241 init1: 871 opt: 1226 Z-score: 1446.2 bits: 276.2 E(32554): 3.1e-74 Smith-Waterman score: 1226; 54.1% identity (78.1% similar) in 342 aa overlap (4-335:3-339) 10 20 30 40 50 pF1KE1 MGCLLFLLLWALLQAWGSAEVPQRL----------FPLRCLQISSFANSSWTRTDGLAWL :::::. .: .. .:: : . .: :: ::::: ::....: .:: CCDS41 MLLLFLLFEGLCCPGENTAAPQALQSYHLAAEEQLSFRMLQTSSFANHSWAHSEGSGWL 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 GELQTHSWSNDSDTVRSLKPWSQGTFSDQQWETLQHIFRVYRSSFTRDVKEFAKMLRLSY :.::::.:.. :.: :::::.:.:: :. ..:: .:..: :: . :. : ...: : CCDS41 GDLQTHGWDTVLGTIRFLKPWSHGNFSKQELKNLQSLFQLYFHSFIQIVQASAGQFQLEY 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 PLELQVSAGCEVHPGNASNNFFHVAFQGKDILSFQGTSWEPTQEAPLWVNLAIQVLNQDK :.:.:. :::.. :: . :...:.::.:.::::: ::::. : . .. .:::. CCDS41 PFEIQILAGCRM---NAPQIFLNMAYQGSDFLSFQGISWEPSPGAGIRAQNICKVLNRYL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 WTRETVQWLLNGTCPQFVSGLLESGKSELKKQVKPKAWLSRGPSPGPGRLLLVCHVSGFY .: .: ::. :::.:..::.:.:.::::..:::.:::: ::::::::: ::::::::: CCDS41 DIKEILQSLLGHTCPRFLAGLMEAGESELKRKVKPEAWLSCGPSPGPGRLQLVCHVSGFY 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 PKPVWVKWMRGEQEQQGTQPGDILPNADETWYLRATLDVVAGEAAGLSCRVKHSSLEGQD :::::: ::::::::.::: ::.::::::::::::::::.:::::::::::::::: :.: CCDS41 PKPVWVMWMRGEQEQRGTQRGDVLPNADETWYLRATLDVAAGEAAGLSCRVKHSSLGGHD 240 250 260 270 280 290 300 310 320 330 pF1KE1 IVLYWGGSYTSMGLIALAVLACLLFLLIVGFTSRFKRQTSYQGVL ....::: . :: :.:.. :..:..: ::.:.:.: ...: CCDS41 LIIHWGGYSIFLILICLTVIVTLVILVVV--DSRLKKQSSNKNILSPHTPSPVFLMGANT 300 310 320 330 340 350 CCDS41 QDTKNSRHQFCLAQVSWIKNRVLKKWKTRLNQLW 360 370 380 >>CCDS41418.1 CD1E gene_id:913|Hs108|chr1 (376 aa) initn: 1241 init1: 871 opt: 1212 Z-score: 1429.9 bits: 273.1 E(32554): 2.5e-73 Smith-Waterman score: 1212; 54.5% identity (78.0% similar) in 336 aa overlap (4-329:3-333) 10 20 30 40 50 pF1KE1 MGCLLFLLLWALLQAWGSAEVPQRL----------FPLRCLQISSFANSSWTRTDGLAWL :::::. .: .. .:: : . .: :: ::::: ::....: .:: CCDS41 MLLLFLLFEGLCCPGENTAAPQALQSYHLAAEEQLSFRMLQTSSFANHSWAHSEGSGWL 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 GELQTHSWSNDSDTVRSLKPWSQGTFSDQQWETLQHIFRVYRSSFTRDVKEFAKMLRLSY :.::::.:.. :.: :::::.:.:: :. ..:: .:..: :: . :. : ...: : CCDS41 GDLQTHGWDTVLGTIRFLKPWSHGNFSKQELKNLQSLFQLYFHSFIQIVQASAGQFQLEY 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 PLELQVSAGCEVHPGNASNNFFHVAFQGKDILSFQGTSWEPTQEAPLWVNLAIQVLNQDK :.:.:. :::.. :: . :...:.::.:.::::: ::::. : . .. .:::. CCDS41 PFEIQILAGCRM---NAPQIFLNMAYQGSDFLSFQGISWEPSPGAGIRAQNICKVLNRYL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 WTRETVQWLLNGTCPQFVSGLLESGKSELKKQVKPKAWLSRGPSPGPGRLLLVCHVSGFY .: .: ::. :::.:..::.:.:.::::..:::.:::: ::::::::: ::::::::: CCDS41 DIKEILQSLLGHTCPRFLAGLMEAGESELKRKVKPEAWLSCGPSPGPGRLQLVCHVSGFY 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 PKPVWVKWMRGEQEQQGTQPGDILPNADETWYLRATLDVVAGEAAGLSCRVKHSSLEGQD :::::: ::::::::.::: ::.::::::::::::::::.:::::::::::::::: :.: CCDS41 PKPVWVMWMRGEQEQRGTQRGDVLPNADETWYLRATLDVAAGEAAGLSCRVKHSSLGGHD 240 250 260 270 280 290 300 310 320 330 pF1KE1 IVLYWGGSYTSMGLIALAVLACLLFLLIVGFTSRFKRQTSYQGVL ....::: . :: :.:.. :..:..: ::.:.:. CCDS41 LIIHWGGYSIFLILICLTVIVTLVILVVVD--SRLKKQSPVFLMGANTQDTKNSRHQFCL 300 310 320 330 340 350 CCDS41 AQVSWIKNRVLKKWKTRLNQLW 360 370 >>CCDS1174.1 CD1A gene_id:909|Hs108|chr1 (327 aa) initn: 1096 init1: 1096 opt: 1165 Z-score: 1375.4 bits: 262.8 E(32554): 2.7e-70 Smith-Waterman score: 1165; 52.0% identity (80.4% similar) in 327 aa overlap (4-328:1-324) 10 20 30 40 50 pF1KE1 MGCLLFLLL--WALLQAWGSAEVPQRLFPLRCLQISSFANSSWTRTDGLAWLGELQTHSW .::::: :.: . :.:. .. . .. :.:: : :: .. .::..::::.: CCDS11 MLFLLLPLLAVLPGDGNADGLKEPLSFHVTWIASFYNHSWKQNLVSGWLSDLQTHTW 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 SNDSDTVRSLKPWSQGTFSDQQWETLQHIFRVYRSSFTRDVKEFAKMLRLSYPLELQVSA ...:.:. : :::.:.::...:. :. .::. . ....:. :.. ::.:.::.. CCDS11 DSNSSTIVFLCPWSRGNFSNEEWKELETLFRIRTIRSFEGIRRYAHELQFEYPFEIQVTG 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 GCEVHPGNASNNFFHVAFQGKDILSFQGTSWEPTQEAPLWVNLAIQVLNQDKWTRETVQW :::.: :..:..:...:.::.:..:::..:: : : .. .::::.. . .. CCDS11 GCELHSGKVSGSFLQLAYQGSDFVSFQNNSWLPYPVAGNMAKHFCKVLNQNQHENDITHN 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 LLNGTCPQFVSGLLESGKSELKKQVKPKAWLSRGPSPGPGRLLLVCHVSGFYPKPVWVKW ::. :::.:. :::..::..:..::::.::::.:::::::.: ::::::::::::::: : CCDS11 LLSDTCPRFILGLLDAGKAHLQRQVKPEAWLSHGPSPGPGHLQLVCHVSGFYPKPVWVMW 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 MRGEQEQQGTQPGDILPNADETWYLRATLDVVAGEAAGLSCRVKHSSLEGQDIVLYWGGS ::::::::::: :::::.:: ::::::::.:.::::: ::::::::::::::::::: CCDS11 MRGEQEQQGTQRGDILPSADGTWYLRATLEVAAGEAADLSCRVKHSSLEGQDIVLYWE-H 240 250 260 270 280 290 300 310 320 330 pF1KE1 YTSMGLIALAVLACLLFLLIVGFTSRFKRQTSYQGVL ..:.:.: :::.. :: :..:.. :... CCDS11 HSSVGFIILAVIVPLL--LLIGLALWFRKRCFC 300 310 320 >>CCDS1176.1 CD1B gene_id:910|Hs108|chr1 (333 aa) initn: 1096 init1: 1096 opt: 1143 Z-score: 1349.4 bits: 258.0 E(32554): 7.7e-69 Smith-Waterman score: 1143; 53.0% identity (77.8% similar) in 334 aa overlap (1-334:1-332) 10 20 30 40 50 60 pF1KE1 MGCLLFLLLWALLQAWGSAEVPQRLFPLRCLQISSFANSSWTRTDGLAWLGELQTHSWSN : : : :: .:. . .: .. : .. .: :::.::.:..:.: .:: .:: :.:.. CCDS11 MLLLPFQLLAVLFPGGNSEHAFQGPTSFHVIQTSSFTNSTWAQTQGSGWLDDLQIHGWDS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 DSDTVRSLKPWSQGTFSDQQWETLQHIFRVYRSSFTRDVKEFAKMLRLSYPLELQVSAGC :: :. :::::.:.:::.. :..::::: .:.:.:..:: ....::.:.: ::: CCDS11 DSGTAIFLKPWSKGNFSDKEVAELEEIFRVYIFGFAREVQDFAGDFQMKYPFEIQGIAGC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 EVHPGNASNNFFHVAFQGKDILSFQGTSWEPTQEAPLWVNLAIQVLNQDKWTRETVQWLL :.: :.: .:.. :. : :.:: ...: :. :. .. .. : . :::. :: CCDS11 ELHSGGAIVSFLRGALGGLDFLSVKNASCVPSPEGGSRAQKFCALIIQYQGIMETVRILL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 NGTCPQFVSGLLESGKSELKKQVKPKAWLSRGPSPGPGRLLLVCHVSGFYPKPVWVKWMR :::... :.:..::..:..::::.:::: ::::::::: ::::::::::::::: ::: CCDS11 YETCPRYLLGVLNAGKADLQRQVKPEAWLSSGPSPGPGRLQLVCHVSGFYPKPVWVMWMR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 GEQEQQGTQPGDILPNADETWYLRATLDVVAGEAAGLSCRVKHSSLEGQDIVLYWGGSYT ::::::::: :::::::. ::::::::::. ::::::::::::::::::::.::: . : CCDS11 GEQEQQGTQLGDILPNANWTWYLRATLDVADGEAAGLSCRVKHSSLEGQDIILYWRNP-T 250 260 270 280 290 310 320 330 pF1KE1 SMGLIALAVLACLLFLLIVGFTSRFKRQTSYQGVL :.: :.::... :.::. .. . :. :::.. CCDS11 SIGSIVLAIIVPSLLLLLC-LALWYMRRRSYQNIP 300 310 320 330 >>CCDS1175.1 CD1C gene_id:911|Hs108|chr1 (333 aa) initn: 1098 init1: 599 opt: 1098 Z-score: 1296.3 bits: 248.2 E(32554): 6.9e-66 Smith-Waterman score: 1098; 49.7% identity (77.1% similar) in 336 aa overlap (1-335:1-333) 10 20 30 40 50 60 pF1KE1 MGCLLFLLLWALLQAWGSAEVPQRLFPLRCLQISSFANSSWTRTDGLAWLGELQTHSWSN : : :::: :: . .:.. :. .. .:: ::.:.::.: .: .:: :::::.:.. CCDS11 MLFLQFLLLALLLPGGDNADASQEHVSFHVIQIFSFVNQSWARGQGSGWLDELQTHGWDS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 DSDTVRSLKPWSQGTFSDQQWETLQHIFRVYRSSFTRDVKEFAKMLRLSYPLELQVSAGC .: :. :. ::.:.::... :. .:: : ..::.... :.. .::.:.::.::: CCDS11 ESGTIIFLHNWSKGNFSNEELSDLELLFRFYLFGLTREIQDHASQDYSKYPFEVQVKAGC 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 EVHPGNASNNFFHVAFQGKDILSFQGTSWEPTQEAPLWVNLAIQVLN-QDKWTRETVQWL :.: :.. ..::.:::.: :.::::.:.: :. .. . ..:: : . . ::: : CCDS11 ELHSGKSPEGFFQVAFNGLDLLSFQNTTWVPSPGCGSLAQSVCHLLNHQYEGVTETVYNL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 LNGTCPQFVSGLLESGKSELKKQVKPKAWLSRGPSPGPGRLLLVCHVSGFYPKPVWVKWM . .:::.:. :::..:: ...::.:.:::: :: : :.::::::.:::::::::: :: CCDS11 IRSTCPRFLLGLLDAGKMYVHRQVRPEAWLSSRPSLGSGQLLLVCHASGFYPKPVWVTWM 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE1 RGEQEQQGTQPGDILPNADETWYLRATLDVVAGEAAGLSCRVKHSSLEGQDIVLYWGGSY :.:::: ::. :::::::: ::::.. :.:.. : :::::::.:::: ::::.:::: . CCDS11 RNEQEQLGTKHGDILPNADGTWYLQVILEVASEEPAGLSCRVRHSSLGGQDIILYWGHHF 250 260 270 280 290 300 300 310 320 330 pF1KE1 TSMGLIALAVLACLLFLLIVGFTSRFKRQTSYQGVL ::. :::.:.. :..:... . ::.. ::: .: CCDS11 -SMNWIALVVIVPLVILIVLVLW--FKKHCSYQDIL 310 320 330 >>CCDS41421.1 CD1E gene_id:913|Hs108|chr1 (290 aa) initn: 1007 init1: 637 opt: 962 Z-score: 1136.9 bits: 218.5 E(32554): 5.3e-57 Smith-Waterman score: 962; 53.0% identity (76.7% similar) in 270 aa overlap (4-263:3-269) 10 20 30 40 50 pF1KE1 MGCLLFLLLWALLQAWGSAEVPQRL----------FPLRCLQISSFANSSWTRTDGLAWL :::::. .: .. .:: : . .: :: ::::: ::....: .:: CCDS41 MLLLFLLFEGLCCPGENTAAPQALQSYHLAAEEQLSFRMLQTSSFANHSWAHSEGSGWL 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 GELQTHSWSNDSDTVRSLKPWSQGTFSDQQWETLQHIFRVYRSSFTRDVKEFAKMLRLSY :.::::.:.. :.: :::::.:.:: :. ..:: .:..: :: . :. : ...: : CCDS41 GDLQTHGWDTVLGTIRFLKPWSHGNFSKQELKNLQSLFQLYFHSFIQIVQASAGQFQLEY 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 PLELQVSAGCEVHPGNASNNFFHVAFQGKDILSFQGTSWEPTQEAPLWVNLAIQVLNQDK :.:.:. :::.. :: . :...:.::.:.::::: ::::. : . .. .:::. CCDS41 PFEIQILAGCRM---NAPQIFLNMAYQGSDFLSFQGISWEPSPGAGIRAQNICKVLNRYL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 WTRETVQWLLNGTCPQFVSGLLESGKSELKKQVKPKAWLSRGPSPGPGRLLLVCHVSGFY .: .: ::. :::.:..::.:.:.::::..:::.:::: ::::::::: ::::::::: CCDS41 DIKEILQSLLGHTCPRFLAGLMEAGESELKRKVKPEAWLSCGPSPGPGRLQLVCHVSGFY 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 PKPVWVKWMRGEQEQQGTQPGDILPNADETWYLRATLDVVAGEAAGLSCRVKHSSLEGQD :::::: ::::::::.::: ::.::::::::.. CCDS41 PKPVWVMWMRGEQEQRGTQRGDVLPNADETWWIFHLSHPDLFDCDSYPGHIGCS 240 250 260 270 280 290 300 310 320 330 pF1KE1 IVLYWGGSYTSMGLIALAVLACLLFLLIVGFTSRFKRQTSYQGVL >>CCDS53387.1 CD1E gene_id:913|Hs108|chr1 (289 aa) initn: 897 init1: 871 opt: 939 Z-score: 1109.8 bits: 213.5 E(32554): 1.7e-55 Smith-Waterman score: 939; 60.4% identity (83.6% similar) in 225 aa overlap (111-335:21-240) 90 100 110 120 130 140 pF1KE1 WETLQHIFRVYRSSFTRDVKEFAKMLRLSYPLELQVSAGCEVHPGNASNNFFHVAFQGKD :.:.:. :::.. :: . :...:.::.: CCDS53 MLLLFLLFEGLCCPGENTADPFEIQILAGCRM---NAPQIFLNMAYQGSD 10 20 30 40 150 160 170 180 190 200 pF1KE1 ILSFQGTSWEPTQEAPLWVNLAIQVLNQDKWTRETVQWLLNGTCPQFVSGLLESGKSELK .::::: ::::. : . .. .:::. .: .: ::. :::.:..::.:.:.:::: CCDS53 FLSFQGISWEPSPGAGIRAQNICKVLNRYLDIKEILQSLLGHTCPRFLAGLMEAGESELK 50 60 70 80 90 100 210 220 230 240 250 260 pF1KE1 KQVKPKAWLSRGPSPGPGRLLLVCHVSGFYPKPVWVKWMRGEQEQQGTQPGDILPNADET ..:::.:::: ::::::::: ::::::::::::::: ::::::::.::: ::.::::::: CCDS53 RKVKPEAWLSCGPSPGPGRLQLVCHVSGFYPKPVWVMWMRGEQEQRGTQRGDVLPNADET 110 120 130 140 150 160 270 280 290 300 310 320 pF1KE1 WYLRATLDVVAGEAAGLSCRVKHSSLEGQDIVLYWGGSYTSMGLIALAVLACLLFLLIVG :::::::::.:::::::::::::::: :.:....::: . :: :.:.. :..:..: CCDS53 WYLRATLDVAAGEAAGLSCRVKHSSLGGHDLIIHWGGYSIFLILICLTVIVTLVILVVVD 170 180 190 200 210 220 330 pF1KE1 FTSRFKRQTSYQGVL ::.:.:.: ...: CCDS53 --SRLKKQSSNKNILSPHTPSPVFLMGANTQDTKNSRHQFCLAQVSWIKNRVLKKWKTRL 230 240 250 260 270 280 >>CCDS41419.1 CD1E gene_id:913|Hs108|chr1 (321 aa) initn: 533 init1: 508 opt: 833 Z-score: 984.3 bits: 190.4 E(32554): 1.7e-48 Smith-Waterman score: 833; 50.8% identity (75.0% similar) in 248 aa overlap (4-241:3-247) 10 20 30 40 50 pF1KE1 MGCLLFLLLWALLQAWGSAEVPQRL----------FPLRCLQISSFANSSWTRTDGLAWL :::::. .: .. .:: : . .: :: ::::: ::....: .:: CCDS41 MLLLFLLFEGLCCPGENTAAPQALQSYHLAAEEQLSFRMLQTSSFANHSWAHSEGSGWL 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 GELQTHSWSNDSDTVRSLKPWSQGTFSDQQWETLQHIFRVYRSSFTRDVKEFAKMLRLSY :.::::.:.. :.: :::::.:.:: :. ..:: .:..: :: . :. : ...: : CCDS41 GDLQTHGWDTVLGTIRFLKPWSHGNFSKQELKNLQSLFQLYFHSFIQIVQASAGQFQLEY 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 PLELQVSAGCEVHPGNASNNFFHVAFQGKDILSFQGTSWEPTQEAPLWVNLAIQVLNQDK :.:.:. :::.. :: . :...:.::.:.::::: ::::. : . .. .:::. CCDS41 PFEIQILAGCRM---NAPQIFLNMAYQGSDFLSFQGISWEPSPGAGIRAQNICKVLNRYL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 WTRETVQWLLNGTCPQFVSGLLESGKSELKKQVKPKAWLSRGPSPGPGRLLLVCHVSGFY .: .: ::. :::.:..::.:.:.::::..:::.:::: ::::::::: ::::::::: CCDS41 DIKEILQSLLGHTCPRFLAGLMEAGESELKRKVKPEAWLSCGPSPGPGRLQLVCHVSGFY 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 PKPVWVKWMRGEQEQQGTQPGDILPNADETWYLRATLDVVAGEAAGLSCRVKHSSLEGQD :::::: :::: CCDS41 PKPVWVMWMRGGYSIFLILICLTVIVTLVILVVVDSRLKKQSPVFLMGANTQDTKNSRHQ 240 250 260 270 280 290 >>CCDS53385.1 CD1E gene_id:913|Hs108|chr1 (298 aa) initn: 927 init1: 628 opt: 674 Z-score: 797.4 bits: 155.7 E(32554): 4.3e-38 Smith-Waterman score: 756; 43.0% identity (58.2% similar) in 342 aa overlap (4-335:3-249) 10 20 30 40 50 pF1KE1 MGCLLFLLLWALLQAWGSAEVPQRL----------FPLRCLQISSFANSSWTRTDGLAWL :::::. .: .. .:: : . .: :: ::::: ::....: .:: CCDS53 MLLLFLLFEGLCCPGENTAAPQALQSYHLAAEEQLSFRMLQTSSFANHSWAHSEGSGWL 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 GELQTHSWSNDSDTVRSLKPWSQGTFSDQQWETLQHIFRVYRSSFTRDVKEFAKMLRLSY :.::::.:.. :.: :::::.:.:: :. ..:: .:..: :: . : CCDS53 GDLQTHGWDTVLGTIRFLKPWSHGNFSKQELKNLQSLFQLYFHSFIQIV----------- 60 70 80 90 100 120 130 140 150 160 170 pF1KE1 PLELQVSAGCEVHPGNASNNFFHVAFQGKDILSFQGTSWEPTQEAPLWVNLAIQVLNQDK :.::: .:: CCDS53 ----QASAG-----------------------QFQ------------------------- 110 180 190 200 210 220 230 pF1KE1 WTRETVQWLLNGTCPQFVSGLLESGKSELKKQVKPKAWLSRGPSPGPGRLLLVCHVSGFY :: .::.:::: ::::::::: ::::::::: CCDS53 ---------------------LE---------LKPEAWLSCGPSPGPGRLQLVCHVSGFY 120 130 140 240 250 260 270 280 290 pF1KE1 PKPVWVKWMRGEQEQQGTQPGDILPNADETWYLRATLDVVAGEAAGLSCRVKHSSLEGQD :::::: ::::::::.::: ::.::::::::::::::::.:::::::::::::::: :.: CCDS53 PKPVWVMWMRGEQEQRGTQRGDVLPNADETWYLRATLDVAAGEAAGLSCRVKHSSLGGHD 150 160 170 180 190 200 300 310 320 330 pF1KE1 IVLYWGGSYTSMGLIALAVLACLLFLLIVGFTSRFKRQTSYQGVL ....::: . :: :.:.. :..:..: ::.:.:.: ...: CCDS53 LIIHWGGYSIFLILICLTVIVTLVILVVV--DSRLKKQSSNKNILSPHTPSPVFLMGANT 210 220 230 240 250 260 CCDS53 QDTKNSRHQFCLAQVSWIKNRVLKKWKTRLNQLW 270 280 290 335 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 18:52:56 2016 done: Sun Nov 6 18:52:56 2016 Total Scan time: 2.830 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]