FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2353, 333 aa 1>>>pF1KE2353 333 - 333 aa - 333 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7925+/-0.000852; mu= 13.1785+/- 0.051 mean_var=69.5294+/-14.569, 0's: 0 Z-trim(107.4): 87 B-trim: 550 in 1/48 Lambda= 0.153812 statistics sampled from 9454 (9546) to 9454 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.67), E-opt: 0.2 (0.293), width: 16 Scan time: 2.050 The best scores are: opt bits E(32554) CCDS1175.1 CD1C gene_id:911|Hs108|chr1 ( 333) 2312 522.0 2.6e-148 CCDS1176.1 CD1B gene_id:910|Hs108|chr1 ( 333) 1364 311.6 5.5e-85 CCDS1174.1 CD1A gene_id:909|Hs108|chr1 ( 327) 1323 302.5 3e-82 CCDS41417.1 CD1E gene_id:913|Hs108|chr1 ( 388) 1174 269.5 3.1e-72 CCDS41418.1 CD1E gene_id:913|Hs108|chr1 ( 376) 1158 266.0 3.5e-71 CCDS1173.1 CD1D gene_id:912|Hs108|chr1 ( 335) 1098 252.6 3.3e-67 CCDS41421.1 CD1E gene_id:913|Hs108|chr1 ( 290) 953 220.4 1.4e-57 CCDS53387.1 CD1E gene_id:913|Hs108|chr1 ( 289) 852 198.0 7.7e-51 CCDS41419.1 CD1E gene_id:913|Hs108|chr1 ( 321) 828 192.7 3.4e-49 CCDS53390.1 CD1E gene_id:913|Hs108|chr1 ( 199) 558 132.7 2.4e-31 CCDS53385.1 CD1E gene_id:913|Hs108|chr1 ( 298) 555 132.1 5.5e-31 CCDS41420.1 CD1E gene_id:913|Hs108|chr1 ( 187) 542 129.2 2.7e-30 CCDS53386.1 CD1E gene_id:913|Hs108|chr1 ( 286) 539 128.6 6.2e-30 CCDS41422.1 CD1E gene_id:913|Hs108|chr1 ( 101) 337 83.6 7.7e-17 CCDS53384.1 CD1E gene_id:913|Hs108|chr1 ( 231) 327 81.5 7.4e-16 CCDS1342.1 MR1 gene_id:3140|Hs108|chr1 ( 341) 295 74.4 1.4e-13 CCDS75412.1 HFE gene_id:3077|Hs108|chr6 ( 337) 277 70.4 2.3e-12 CCDS47387.1 HFE gene_id:3077|Hs108|chr6 ( 325) 276 70.2 2.6e-12 CCDS4578.1 HFE gene_id:3077|Hs108|chr6 ( 348) 276 70.2 2.7e-12 CCDS5680.1 AZGP1 gene_id:563|Hs108|chr7 ( 298) 272 69.3 4.4e-12 CCDS4668.1 G gene_id:3135|Hs108|chr6 ( 338) 268 68.4 9.1e-12 CCDS4580.1 HFE gene_id:3077|Hs108|chr6 ( 260) 257 66.0 3.9e-11 >>CCDS1175.1 CD1C gene_id:911|Hs108|chr1 (333 aa) initn: 2312 init1: 2312 opt: 2312 Z-score: 2776.1 bits: 522.0 E(32554): 2.6e-148 Smith-Waterman score: 2312; 100.0% identity (100.0% similar) in 333 aa overlap (1-333:1-333) 10 20 30 40 50 60 pF1KE2 MLFLQFLLLALLLPGGDNADASQEHVSFHVIQIFSFVNQSWARGQGSGWLDELQTHGWDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MLFLQFLLLALLLPGGDNADASQEHVSFHVIQIFSFVNQSWARGQGSGWLDELQTHGWDS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 ESGTIIFLHNWSKGNFSNEELSDLELLFRFYLFGLTREIQDHASQDYSKYPFEVQVKAGC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ESGTIIFLHNWSKGNFSNEELSDLELLFRFYLFGLTREIQDHASQDYSKYPFEVQVKAGC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 ELHSGKSPEGFFQVAFNGLDLLSFQNTTWVPSPGCGSLAQSVCHLLNHQYEGVTETVYNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 ELHSGKSPEGFFQVAFNGLDLLSFQNTTWVPSPGCGSLAQSVCHLLNHQYEGVTETVYNL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 IRSTCPRFLLGLLDAGKMYVHRQVRPEAWLSSRPSLGSGQLLLVCHASGFYPKPVWVTWM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 IRSTCPRFLLGLLDAGKMYVHRQVRPEAWLSSRPSLGSGQLLLVCHASGFYPKPVWVTWM 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 RNEQEQLGTKHGDILPNADGTWYLQVILEVASEEPAGLSCRVRHSSLGGQDIILYWGHHF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 RNEQEQLGTKHGDILPNADGTWYLQVILEVASEEPAGLSCRVRHSSLGGQDIILYWGHHF 250 260 270 280 290 300 310 320 330 pF1KE2 SMNWIALVVIVPLVILIVLVLWFKKHCSYQDIL ::::::::::::::::::::::::::::::::: CCDS11 SMNWIALVVIVPLVILIVLVLWFKKHCSYQDIL 310 320 330 >>CCDS1176.1 CD1B gene_id:910|Hs108|chr1 (333 aa) initn: 1318 init1: 676 opt: 1364 Z-score: 1639.2 bits: 311.6 E(32554): 5.5e-85 Smith-Waterman score: 1364; 60.4% identity (81.7% similar) in 333 aa overlap (1-332:1-332) 10 20 30 40 50 60 pF1KE2 MLFLQFLLLALLLPGGDNADASQEHVSFHVIQIFSFVNQSWARGQGSGWLDELQTHGWDS ::.: : :::.:.:::.. : : .:::::: ::.:..::. :::::::.:: ::::: CCDS11 MLLLPFQLLAVLFPGGNSEHAFQGPTSFHVIQTSSFTNSTWAQTQGSGWLDDLQIHGWDS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 ESGTIIFLHNWSKGNFSNEELSDLELLFRFYLFGLTREIQDHASQDYSKYPFEVQVKAGC .::: :::. :::::::..:...:: .:: :.::..::.:: :.. :::::.: ::: CCDS11 DSGTAIFLKPWSKGNFSDKEVAELEEIFRVYIFGFAREVQDFAGDFQMKYPFEIQGIAGC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 ELHSGKSPEGFFQVAFNGLDLLSFQNTTWVPSPGCGSLAQSVCHLLNHQYEGVTETVYNL ::::: . .:.. :..:::.:: .:.. :::: :: ::. : :. ::.:. ::: : CCDS11 ELHSGGAIVSFLRGALGGLDFLSVKNASCVPSPEGGSRAQKFCALII-QYQGIMETVRIL 130 140 150 160 170 190 200 210 220 230 240 pF1KE2 IRSTCPRFLLGLLDAGKMYVHRQVRPEAWLSSRPSLGSGQLLLVCHASGFYPKPVWVTWM . ::::.:::.:.::: ..:::.::::::: :: : :.: ::::.:::::::::: :: CCDS11 LYETCPRYLLGVLNAGKADLQRQVKPEAWLSSGPSPGPGRLQLVCHVSGFYPKPVWVMWM 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE2 RNEQEQLGTKHGDILPNADGTWYLQVILEVASEEPAGLSCRVRHSSLGGQDIILYWGHHF :.:::: ::. :::::::. ::::.. :.::. : :::::::.:::: :::::::: . CCDS11 RGEQEQQGTQLGDILPNANWTWYLRATLDVADGEAAGLSCRVKHSSLEGQDIILYWRNPT 240 250 260 270 280 290 310 320 330 pF1KE2 SMNWIALVVIVP-LVILIVLVLWFKKHCSYQDIL :.. :.:..::: :..:. :.::. .. :::.: CCDS11 SIGSIVLAIIVPSLLLLLCLALWYMRRRSYQNIP 300 310 320 330 >>CCDS1174.1 CD1A gene_id:909|Hs108|chr1 (327 aa) initn: 1343 init1: 748 opt: 1323 Z-score: 1590.2 bits: 302.5 E(32554): 3e-82 Smith-Waterman score: 1323; 58.7% identity (80.7% similar) in 327 aa overlap (1-327:1-325) 10 20 30 40 50 60 pF1KE2 MLFLQFLLLALLLPGGDNADASQEHVSFHVIQIFSFVNQSWARGQGSGWLDELQTHGWDS :::: . :::.: :: :::. .: .:::: : :: :.:: .. ::::..:::: ::: CCDS11 MLFLLLPLLAVL-PGDGNADGLKEPLSFHVTWIASFYNHSWKQNLVSGWLSDLQTHTWDS 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 ESGTIIFLHNWSKGNFSNEELSDLELLFRFYLFGLTREIQDHASQDYSKYPFEVQVKAGC .:.::.:: ::.::::::: ..:: :::. . . :. .: . .::::.:: .:: CCDS11 NSSTIVFLCPWSRGNFSNEEWKELETLFRIRTIRSFEGIRRYAHELQFEYPFEIQVTGGC 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 ELHSGKSPEGFFQVAFNGLDLLSFQNTTWVPSPGCGSLAQSVCHLLNHQYEGVTETVYNL :::::: .:.:.:..: :..::::..:.: : :..:. :..:: : . .. ..:: CCDS11 ELHSGKVSGSFLQLAYQGSDFVSFQNNSWLPYPVAGNMAKHFCKVLN-QNQHENDITHNL 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE2 IRSTCPRFLLGLLDAGKMYVHRQVRPEAWLSSRPSLGSGQLLLVCHASGFYPKPVWVTWM . .:::::.:::::::: ...:::.:::::: :: : :.: ::::.:::::::::: :: CCDS11 LSDTCPRFILGLLDAGKAHLQRQVKPEAWLSHGPSPGPGHLQLVCHVSGFYPKPVWVMWM 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE2 RNEQEQLGTKHGDILPNADGTWYLQVILEVASEEPAGLSCRVRHSSLGGQDIILYWGHHF :.:::: ::..:::::.:::::::.. ::::. : : :::::.:::: ::::.::: :: CCDS11 RGEQEQQGTQRGDILPSADGTWYLRATLEVAAGEAADLSCRVKHSSLEGQDIVLYWEHHS 240 250 260 270 280 290 310 320 330 pF1KE2 SMNWIALVVIVPLVILIVLVLWFKKHCSYQDIL :...: :.:::::..:: :.:::.:.: CCDS11 SVGFIILAVIVPLLLLIGLALWFRKRCFC 300 310 320 >>CCDS41417.1 CD1E gene_id:913|Hs108|chr1 (388 aa) initn: 992 init1: 601 opt: 1174 Z-score: 1410.3 bits: 269.5 E(32554): 3.1e-72 Smith-Waterman score: 1174; 51.0% identity (77.8% similar) in 343 aa overlap (1-333:1-339) 10 20 30 40 50 pF1KE2 MLFLQFLLLALLLPGGDNAD---------ASQEHVSFHVIQIFSFVNQSWARGQGSGWLD ::.: .:. .: :: ..: :..:..::...: ::.:.:::...::::: CCDS41 MLLLFLLFEGLCCPGENTAAPQALQSYHLAAEEQLSFRMLQTSSFANHSWAHSEGSGWLG 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 ELQTHGWDSESGTIIFLHNWSKGNFSNEELSDLELLFRFYLFGLTREIQDHASQDYSKYP .:::::::. ::: ::. ::.::::..::..:. ::..:. .. . .: :.: .:: CCDS41 DLQTHGWDTVLGTIRFLKPWSHGNFSKQELKNLQSLFQLYFHSFIQIVQASAGQFQLEYP 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 FEVQVKAGCELHSGKSPEGFFQVAFNGLDLLSFQNTTWVPSPGCGSLAQSVCHLLNHQYE ::.:. :::.... :. :...:..: :.::::. .: :::: : ::..:..:: .: CCDS41 FEIQILAGCRMNA---PQIFLNMAYQGSDFLSFQGISWEPSPGAGIRAQNICKVLN-RYL 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 GVTETVYNLIRSTCPRFLLGLLDAGKMYVHRQVRPEAWLSSRPSLGSGQLLLVCHASGFY . : . .:. :::::: ::..::. ..:.:.:::::: :: : :.: ::::.:::: CCDS41 DIKEILQSLLGHTCPRFLAGLMEAGESELKRKVKPEAWLSCGPSPGPGRLQLVCHVSGFY 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 PKPVWVTWMRNEQEQLGTKHGDILPNADGTWYLQVILEVASEEPAGLSCRVRHSSLGGQD :::::: :::.:::: ::..::.::::: ::::.. :.::. : :::::::.::::::.: CCDS41 PKPVWVMWMRGEQEQRGTQRGDVLPNADETWYLRATLDVAAGEAAGLSCRVKHSSLGGHD 240 250 260 270 280 290 300 310 320 330 pF1KE2 IILYWG-HHFSMNWIALVVIVPLVILIVLVLWFKKHCSYQDIL .:..:: . . . : :.::: ::::.:. .::. : ..:: CCDS41 LIIHWGGYSIFLILICLTVIVTLVILVVVDSRLKKQSSNKNILSPHTPSPVFLMGANTQD 300 310 320 330 340 350 CCDS41 TKNSRHQFCLAQVSWIKNRVLKKWKTRLNQLW 360 370 380 >>CCDS41418.1 CD1E gene_id:913|Hs108|chr1 (376 aa) initn: 992 init1: 601 opt: 1158 Z-score: 1391.3 bits: 266.0 E(32554): 3.5e-71 Smith-Waterman score: 1158; 51.2% identity (78.0% similar) in 336 aa overlap (1-326:1-332) 10 20 30 40 50 pF1KE2 MLFLQFLLLALLLPGGDNAD---------ASQEHVSFHVIQIFSFVNQSWARGQGSGWLD ::.: .:. .: :: ..: :..:..::...: ::.:.:::...::::: CCDS41 MLLLFLLFEGLCCPGENTAAPQALQSYHLAAEEQLSFRMLQTSSFANHSWAHSEGSGWLG 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 ELQTHGWDSESGTIIFLHNWSKGNFSNEELSDLELLFRFYLFGLTREIQDHASQDYSKYP .:::::::. ::: ::. ::.::::..::..:. ::..:. .. . .: :.: .:: CCDS41 DLQTHGWDTVLGTIRFLKPWSHGNFSKQELKNLQSLFQLYFHSFIQIVQASAGQFQLEYP 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 FEVQVKAGCELHSGKSPEGFFQVAFNGLDLLSFQNTTWVPSPGCGSLAQSVCHLLNHQYE ::.:. :::.... :. :...:..: :.::::. .: :::: : ::..:..:: .: CCDS41 FEIQILAGCRMNA---PQIFLNMAYQGSDFLSFQGISWEPSPGAGIRAQNICKVLN-RYL 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 GVTETVYNLIRSTCPRFLLGLLDAGKMYVHRQVRPEAWLSSRPSLGSGQLLLVCHASGFY . : . .:. :::::: ::..::. ..:.:.:::::: :: : :.: ::::.:::: CCDS41 DIKEILQSLLGHTCPRFLAGLMEAGESELKRKVKPEAWLSCGPSPGPGRLQLVCHVSGFY 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 PKPVWVTWMRNEQEQLGTKHGDILPNADGTWYLQVILEVASEEPAGLSCRVRHSSLGGQD :::::: :::.:::: ::..::.::::: ::::.. :.::. : :::::::.::::::.: CCDS41 PKPVWVMWMRGEQEQRGTQRGDVLPNADETWYLRATLDVAAGEAAGLSCRVKHSSLGGHD 240 250 260 270 280 290 300 310 320 330 pF1KE2 IILYWG-HHFSMNWIALVVIVPLVILIVLVLWFKKHCSYQDIL .:..:: . . . : :.::: ::::.:. .::. CCDS41 LIIHWGGYSIFLILICLTVIVTLVILVVVDSRLKKQSPVFLMGANTQDTKNSRHQFCLAQ 300 310 320 330 340 350 CCDS41 VSWIKNRVLKKWKTRLNQLW 360 370 >>CCDS1173.1 CD1D gene_id:912|Hs108|chr1 (335 aa) initn: 1098 init1: 599 opt: 1098 Z-score: 1320.2 bits: 252.6 E(32554): 3.3e-67 Smith-Waterman score: 1098; 49.7% identity (77.1% similar) in 336 aa overlap (1-333:1-335) 10 20 30 40 50 60 pF1KE2 MLFLQFLLLALLLPGGDNADASQEHVSFHVIQIFSFVNQSWARGQGSGWLDELQTHGWDS : : :::: :: . .:.. :. .. .:: ::.:.::.: .: .:: :::::.:.. CCDS11 MGCLLFLLLWALLQAWGSAEVPQRLFPLRCLQISSFANSSWTRTDGLAWLGELQTHSWSN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 ESGTIIFLHNWSKGNFSNEELSDLELLFRFYLFGLTREIQDHASQDYSKYPFEVQVKAGC .: :. :. ::.:.::... :. .:: : ..::.... :.. .::.:.::.::: CCDS11 DSDTVRSLKPWSQGTFSDQQWETLQHIFRVYRSSFTRDVKEFAKMLRLSYPLELQVSAGC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 ELHSGKSPEGFFQVAFNGLDLLSFQNTTWVPSPGCGSLAQSVCHLLNHQYEGVTETVYNL :.: :.. ..::.:::.: :.::::.:.: :. .. . ..:: : . . ::: : CCDS11 EVHPGNASNNFFHVAFQGKDILSFQGTSWEPTQEAPLWVNLAIQVLN-QDKWTRETVQWL 130 140 150 160 170 190 200 210 220 230 240 pF1KE2 IRSTCPRFLLGLLDAGKMYVHRQVRPEAWLSSRPSLGSGQLLLVCHASGFYPKPVWVTWM . .:::.:. :::..:: ...::.:.:::: :: : :.::::::.:::::::::: :: CCDS11 LNGTCPQFVSGLLESGKSELKKQVKPKAWLSRGPSPGPGRLLLVCHVSGFYPKPVWVKWM 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE2 RNEQEQLGTKHGDILPNADGTWYLQVILEVASEEPAGLSCRVRHSSLGGQDIILYWGHHF :.:::: ::. :::::::: ::::.. :.:.. : :::::::.:::: ::::.:::: . CCDS11 RGEQEQQGTQPGDILPNADETWYLRATLDVVAGEAAGLSCRVKHSSLEGQDIVLYWGGSY 240 250 260 270 280 290 310 320 330 pF1KE2 -SMNWIALVVIVPLVILIVLVLW--FKKHCSYQDIL ::. :::.:.. :..:... . ::.. ::: .: CCDS11 TSMGLIALAVLACLLFLLIVGFTSRFKRQTSYQGVL 300 310 320 330 >>CCDS41421.1 CD1E gene_id:913|Hs108|chr1 (290 aa) initn: 937 init1: 419 opt: 953 Z-score: 1147.3 bits: 220.4 E(32554): 1.4e-57 Smith-Waterman score: 953; 50.2% identity (77.7% similar) in 273 aa overlap (1-264:1-269) 10 20 30 40 50 pF1KE2 MLFLQFLLLALLLPGGDNAD---------ASQEHVSFHVIQIFSFVNQSWARGQGSGWLD ::.: .:. .: :: ..: :..:..::...: ::.:.:::...::::: CCDS41 MLLLFLLFEGLCCPGENTAAPQALQSYHLAAEEQLSFRMLQTSSFANHSWAHSEGSGWLG 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 ELQTHGWDSESGTIIFLHNWSKGNFSNEELSDLELLFRFYLFGLTREIQDHASQDYSKYP .:::::::. ::: ::. ::.::::..::..:. ::..:. .. . .: :.: .:: CCDS41 DLQTHGWDTVLGTIRFLKPWSHGNFSKQELKNLQSLFQLYFHSFIQIVQASAGQFQLEYP 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 FEVQVKAGCELHSGKSPEGFFQVAFNGLDLLSFQNTTWVPSPGCGSLAQSVCHLLNHQYE ::.:. :::.... :. :...:..: :.::::. .: :::: : ::..:..:: .: CCDS41 FEIQILAGCRMNA---PQIFLNMAYQGSDFLSFQGISWEPSPGAGIRAQNICKVLN-RYL 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 GVTETVYNLIRSTCPRFLLGLLDAGKMYVHRQVRPEAWLSSRPSLGSGQLLLVCHASGFY . : . .:. :::::: ::..::. ..:.:.:::::: :: : :.: ::::.:::: CCDS41 DIKEILQSLLGHTCPRFLAGLMEAGESELKRKVKPEAWLSCGPSPGPGRLQLVCHVSGFY 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 PKPVWVTWMRNEQEQLGTKHGDILPNADGTWYLQVILEVASEEPAGLSCRVRHSSLGGQD :::::: :::.:::: ::..::.::::: ::.. CCDS41 PKPVWVMWMRGEQEQRGTQRGDVLPNADETWWIFHLSHPDLFDCDSYPGHIGCS 240 250 260 270 280 290 300 310 320 330 pF1KE2 IILYWGHHFSMNWIALVVIVPLVILIVLVLWFKKHCSYQDIL >>CCDS53387.1 CD1E gene_id:913|Hs108|chr1 (289 aa) initn: 689 init1: 601 opt: 852 Z-score: 1026.2 bits: 198.0 E(32554): 7.7e-51 Smith-Waterman score: 854; 52.0% identity (76.4% similar) in 250 aa overlap (86-333:1-240) 60 70 80 90 100 110 pF1KE2 HGWDSESGTIIFLHNWSKGNFSNEELSDLELLFRFYLF-GLTREIQDHASQDYSKYPFEV .:. : :: :: .. :. :::. CCDS53 MLLLFLLFEGLCCPGENTAD------PFEI 10 20 120 130 140 150 160 170 pF1KE2 QVKAGCELHSGKSPEGFFQVAFNGLDLLSFQNTTWVPSPGCGSLAQSVCHLLNHQYEGVT :. :::.... :. :...:..: :.::::. .: :::: : ::..:..:: .: . CCDS53 QILAGCRMNA---PQIFLNMAYQGSDFLSFQGISWEPSPGAGIRAQNICKVLN-RYLDIK 30 40 50 60 70 80 180 190 200 210 220 230 pF1KE2 ETVYNLIRSTCPRFLLGLLDAGKMYVHRQVRPEAWLSSRPSLGSGQLLLVCHASGFYPKP : . .:. :::::: ::..::. ..:.:.:::::: :: : :.: ::::.::::::: CCDS53 EILQSLLGHTCPRFLAGLMEAGESELKRKVKPEAWLSCGPSPGPGRLQLVCHVSGFYPKP 90 100 110 120 130 140 240 250 260 270 280 290 pF1KE2 VWVTWMRNEQEQLGTKHGDILPNADGTWYLQVILEVASEEPAGLSCRVRHSSLGGQDIIL ::: :::.:::: ::..::.::::: ::::.. :.::. : :::::::.::::::.:.:. CCDS53 VWVMWMRGEQEQRGTQRGDVLPNADETWYLRATLDVAAGEAAGLSCRVKHSSLGGHDLII 150 160 170 180 190 200 300 310 320 330 pF1KE2 YWG-HHFSMNWIALVVIVPLVILIVLVLWFKKHCSYQDIL .:: . . . : :.::: ::::.:. .::. : ..:: CCDS53 HWGGYSIFLILICLTVIVTLVILVVVDSRLKKQSSNKNILSPHTPSPVFLMGANTQDTKN 210 220 230 240 250 260 CCDS53 SRHQFCLAQVSWIKNRVLKKWKTRLNQLW 270 280 >>CCDS41419.1 CD1E gene_id:913|Hs108|chr1 (321 aa) initn: 732 init1: 362 opt: 828 Z-score: 996.7 bits: 192.7 E(32554): 3.4e-49 Smith-Waterman score: 839; 48.8% identity (76.4% similar) in 250 aa overlap (1-241:1-246) 10 20 30 40 50 pF1KE2 MLFLQFLLLALLLPGGDNAD---------ASQEHVSFHVIQIFSFVNQSWARGQGSGWLD ::.: .:. .: :: ..: :..:..::...: ::.:.:::...::::: CCDS41 MLLLFLLFEGLCCPGENTAAPQALQSYHLAAEEQLSFRMLQTSSFANHSWAHSEGSGWLG 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 ELQTHGWDSESGTIIFLHNWSKGNFSNEELSDLELLFRFYLFGLTREIQDHASQDYSKYP .:::::::. ::: ::. ::.::::..::..:. ::..:. .. . .: :.: .:: CCDS41 DLQTHGWDTVLGTIRFLKPWSHGNFSKQELKNLQSLFQLYFHSFIQIVQASAGQFQLEYP 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 FEVQVKAGCELHSGKSPEGFFQVAFNGLDLLSFQNTTWVPSPGCGSLAQSVCHLLNHQYE ::.:. :::.... :. :...:..: :.::::. .: :::: : ::..:..:: .: CCDS41 FEIQILAGCRMNA---PQIFLNMAYQGSDFLSFQGISWEPSPGAGIRAQNICKVLN-RYL 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 GVTETVYNLIRSTCPRFLLGLLDAGKMYVHRQVRPEAWLSSRPSLGSGQLLLVCHASGFY . : . .:. :::::: ::..::. ..:.:.:::::: :: : :.: ::::.:::: CCDS41 DIKEILQSLLGHTCPRFLAGLMEAGESELKRKVKPEAWLSCGPSPGPGRLQLVCHVSGFY 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 PKPVWVTWMRNEQEQLGTKHGDILPNADGTWYLQVILEVASEEPAGLSCRVRHSSLGGQD :::::: ::: CCDS41 PKPVWVMWMRGGYSIFLILICLTVIVTLVILVVVDSRLKKQSPVFLMGANTQDTKNSRHQ 240 250 260 270 280 290 >>CCDS53390.1 CD1E gene_id:913|Hs108|chr1 (199 aa) initn: 526 init1: 499 opt: 558 Z-score: 676.2 bits: 132.7 E(32554): 2.4e-31 Smith-Waterman score: 558; 59.1% identity (77.9% similar) in 149 aa overlap (188-333:5-150) 160 170 180 190 200 210 pF1KE2 LAQSVCHLLNHQYEGVTETVYNLIRSTCPRFLL--GLLDAGKMYVHRQVRPEAWLSSRPS ::: :: :. . :.:::::: :: CCDS53 MLLLFLLFEGLCCPGE---NTAVKPEAWLSCGPS 10 20 30 220 230 240 250 260 270 pF1KE2 LGSGQLLLVCHASGFYPKPVWVTWMRNEQEQLGTKHGDILPNADGTWYLQVILEVASEEP : :.: ::::.:::::::::: :::.:::: ::..::.::::: ::::.. :.::. : CCDS53 PGPGRLQLVCHVSGFYPKPVWVMWMRGEQEQRGTQRGDVLPNADETWYLRATLDVAAGEA 40 50 60 70 80 90 280 290 300 310 320 330 pF1KE2 AGLSCRVRHSSLGGQDIILYWG-HHFSMNWIALVVIVPLVILIVLVLWFKKHCSYQDIL :::::::.::::::.:.:..:: . . . : :.::: ::::.:. .::. : ..:: CCDS53 AGLSCRVKHSSLGGHDLIIHWGGYSIFLILICLTVIVTLVILVVVDSRLKKQSSNKNILS 100 110 120 130 140 150 CCDS53 PHTPSPVFLMGANTQDTKNSRHQFCLAQVSWIKNRVLKKWKTRLNQLW 160 170 180 190 333 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 18:52:13 2016 done: Sun Nov 6 18:52:14 2016 Total Scan time: 2.050 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]