FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE1967, 530 aa
1>>>pF1KE1967 530 - 530 aa - 530 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.8658+/-0.000836; mu= 9.1037+/- 0.051
mean_var=190.6086+/-38.313, 0's: 0 Z-trim(114.5): 16 B-trim: 0 in 0/53
Lambda= 0.092897
statistics sampled from 15051 (15061) to 15051 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.77), E-opt: 0.2 (0.463), width: 16
Scan time: 3.360
The best scores are: opt bits E(32554)
CCDS3129.1 CHST2 gene_id:9435|Hs108|chr3 ( 530) 3624 497.9 1.2e-140
CCDS10918.1 CHST6 gene_id:4166|Hs108|chr16 ( 395) 577 89.4 8.2e-18
CCDS10919.1 CHST5 gene_id:23563|Hs108|chr16 ( 411) 576 89.3 9.2e-18
CCDS14268.1 CHST7 gene_id:56548|Hs108|chrX ( 486) 558 87.0 5.6e-17
CCDS7312.1 CHST3 gene_id:9469|Hs108|chr10 ( 479) 416 67.9 2.9e-11
>>CCDS3129.1 CHST2 gene_id:9435|Hs108|chr3 (530 aa)
initn: 3624 init1: 3624 opt: 3624 Z-score: 2638.6 bits: 497.9 E(32554): 1.2e-140
Smith-Waterman score: 3624; 100.0% identity (100.0% similar) in 530 aa overlap (1-530:1-530)
10 20 30 40 50 60
pF1KE1 MSRSPQRALPPGALPRLLQAAPAAAPRALLPQWPRRPGRRWPASPLGMKVFRRKALVLCA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 MSRSPQRALPPGALPRLLQAAPAAAPRALLPQWPRRPGRRWPASPLGMKVFRRKALVLCA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 GYALLLVLTMLNLLDYKWHKEPLQQCNPDGPLGAAAGAAGGSWGRPGPPPAGPPRAHARL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 GYALLLVLTMLNLLDYKWHKEPLQQCNPDGPLGAAAGAAGGSWGRPGPPPAGPPRAHARL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 DLRTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 DLRTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFF
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 GELFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 GELFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE1 GRNLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKKCPPQRLARFEEECRKYRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 GRNLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKKCPPQRLARFEEECRKYRT
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE1 LVIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LVIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRD
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE1 PRAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 PRAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHY
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAA
430 440 450 460 470 480
490 500 510 520 530
pF1KE1 NAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS31 NAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
490 500 510 520 530
>>CCDS10918.1 CHST6 gene_id:4166|Hs108|chr16 (395 aa)
initn: 822 init1: 299 opt: 577 Z-score: 433.3 bits: 89.4 E(32554): 8.2e-18
Smith-Waterman score: 857; 38.8% identity (67.2% similar) in 381 aa overlap (153-529:30-378)
130 140 150 160 170 180
pF1KE1 RTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGE
: . .: :. : : :...::::::: :.
CCDS10 MWLPRVSSTAVTALLLAQTFLLLFLVSRPGPSSPAG-GEARVHVLVLSSWRSGSSFVGQ
10 20 30 40 50
190 200 210 220 230 240
pF1KE1 LFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSGGR
::::.:.::.:.::.:::: : :.:..:. :.::.. ... ::..::. : : :
CCDS10 LFNQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDLVRSVFLCDMDVFDAYLPW---RR
60 70 80 90 100 110
250 260 270 280 290 300
pF1KE1 NLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKK-CPPQRLARFEEECRKYRTL
::. : : :.....:: : : :. . ... .. ::: : : .. .: ::.: .
CCDS10 NLSDL--FQWAVSRALCSPPACSAFPRGAIS--SEAVCKPLCARQSFTLAREACRSYSHV
120 130 140 150 160 170
310 320 330 340 350 360
pF1KE1 VIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDP
:.: :: :.. :: ::: ::::.:...::::::::: :: .. ..: :..
CCDS10 VLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAVLRSREQTAKALARDN---------
180 190 200 210 220
370 380 390 400 410 420
pF1KE1 RAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTA-LQPPDWLQGHY
: ::.. :. :: .: ... .: : .. ..: :.:: .:.:.:
CCDS10 -----------GIVLGTN--GTWVEAD-PGLRVVREVCRSHVRIAEAATLKPPPFLRGRY
230 240 250 260
430 440 450 460 470
pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSK--PFVVSARNATQ
.::.:::. .:. .: .: :.:: ..:..: . :.: ::: ... : .:.::: .
CCDS10 RLVRFEDLAREPLAEIRALYAFTGLSLTPQLEAWIHNITHGSGPGARREAFKTSSRNALN
270 280 290 300 310 320
480 490 500 510 520 530
pF1KE1 AANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
...::: :: : .:..:.:.: . .:::. : : .: ..:. :. ::
CCDS10 VSQAWRHALPFAKIRRVQELCAGALQLLGYRPVYSEDEQRNLALDLVL-PRGLNGFTWAS
330 340 350 360 370 380
CCDS10 STASHPRN
390
>>CCDS10919.1 CHST5 gene_id:23563|Hs108|chr16 (411 aa)
initn: 821 init1: 293 opt: 576 Z-score: 432.3 bits: 89.3 E(32554): 9.2e-18
Smith-Waterman score: 865; 40.1% identity (67.0% similar) in 382 aa overlap (153-529:52-400)
130 140 150 160 170 180
pF1KE1 RTPYRPPAAAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGE
: . .: :. : : :...:::::::.:.
CCDS10 MWLPRFSSKTVTVLLLAQTTCLLLFIISRPGPSSPAG-GEDRVHVLVLSSWRSGSSFLGQ
30 40 50 60 70 80
190 200 210 220 230 240
pF1KE1 LFNQNPEVFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGSGGR
::.:.:.::.:.::.:::: : :.:..:. :.::.. ... ::..::. : : . :
CCDS10 LFSQHPDVFYLMEPAWHVWTTLSQGSAATLHMAVRDLMRSIFLCDMDVFDAYMPQS---R
90 100 110 120 130
250 260 270 280 290 300
pF1KE1 NLTTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCKK-CPPQRLARFEEECRKYRTL
::... :. ::....:: : : :. . ... : ::: : : .. .: ::.: .
CCDS10 NLSAF--FNWATSRALCSPPACSAFPRGTISKQD--VCKTLCTRQPFSLAREACRSYSHV
140 150 160 170 180 190
310 320 330 340 350 360
pF1KE1 VIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDP
:.: :: :.. :: ::: ::::.:...::::::::: .::: :. . .::
CCDS10 VLKEVRFFNLQVLYPLLSDPALNLRIVHLVRDPRAV----LRSR-----EAAGPILARD-
200 210 220 230 240
370 380 390 400 410 420
pF1KE1 RAHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTA-LQPPDWLQGHY
: ::.. . : :: : : .. .: : .. ..: :.:: .:.:.:
CCDS10 ----------NGIVLGTNGKWV--EADPH-LRLIREVCRSHVRIAEAATLKPPPFLRGRY
250 260 270 280 290
430 440 450 460 470
pF1KE1 LVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKP---FVVSARNAT
.::.:::. .:. .: .: :.:: ..:..: . :.: ::: . :: : .:.:::
CCDS10 RLVRFEDLAREPLAEIRALYAFTGLTLTPQLEAWIHNITHGSGIG-KPIEAFHTSSRNAR
300 310 320 330 340
480 490 500 510 520 530
pF1KE1 QAANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
....::: :: : .: .:.: : . .:::. : : .. .::. :. ::
CCDS10 NVSQAWRHALPFTKILRVQEVCAGALQLLGYRPVYSADQQRDLTLDLVL-PRGPDHFSWA
350 360 370 380 390 400
CCDS10 SPD
410
>>CCDS14268.1 CHST7 gene_id:56548|Hs108|chrX (486 aa)
initn: 1093 init1: 408 opt: 558 Z-score: 418.3 bits: 87.0 E(32554): 5.6e-17
Smith-Waterman score: 1211; 45.4% identity (68.2% similar) in 491 aa overlap (48-516:1-465)
20 30 40 50 60 70
pF1KE1 LQAAPAAAPRALLPQWPRRPGRRWPASPLGMKVFRRKALVLCAGYALLLVLTMLNLLDYK
:: ::. : .:::::: : ::
CCDS14 MKGRRRRRREYCK-FALLLVLYTLVLL---
10 20
80 90 100 110 120 130
pF1KE1 WHKEPLQQCNPDGPLGAAAGAAGGSWGRPGPPPAGPPRAHARLDLRTPYRPPAAAVG---
: :: : : . .. : : :. . .:. :::.:
CCDS14 -----LVPSVLDG------GRDGDKGAEHCP---GLQRSLGVWSLE------AAAAGERE
30 40 50 60
140 150 160 170 180
pF1KE1 -AAPAAAAGMAGVAAPPGNGTRGTGGVGD----KRQLVYVFTTWRSGSSFFGELFNQNPE
.: : :: .:. : . .:.::. ..: .:: .:::.::::.::::::.:.
CCDS14 QGAEARAAEEGGANQSPRFPSNLSGAVGEAVSREKQHIYVHATWRTGSSFLGELFNQHPD
70 80 90 100 110 120
190 200 210 220 230 240
pF1KE1 VFFLYEPVWHVWQKLYPGDAVSLQGAARDMLSALYRCDLSVFQLYSPAGS-GGR-----N
::.::::.::.:: :::::: ::::: :::: .:.:::.::..::.: :. ..: :
CCDS14 VFYLYEPMWHLWQALYPGDAESLQGALRDMLRSLFRCDFSVLRLYAPPGDPAARAPDTAN
130 140 150 160 170 180
250 260 270 280 290 300
pF1KE1 LTTLGIFGAATNKVVCSSPLCP-AYRKEV-VGLVDDRVCKK-CPPQRLARFEEECRKYRT
::: ..: ::::.:: :::: : : .. ::::.: .:.. ::: . .: ::::: .
CCDS14 LTTAALFRWRTNKVICSPPLCPGAPRARAEVGLVEDTACERSCPPVAIRALEAECRKYPV
190 200 210 220 230 240
310 320 330 340 350 360
pF1KE1 LVIKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRD
.::: ::..:..::.::::::.:.:::..: :::::: .::..::.::.:::.::.:.:.
CCDS14 VVIKDVRLLDLGVLVPLLRDPGLNLKVVQLFRDPRAVHNSRLKSRQGLLRESIQVLRTRQ
250 260 270 280 290 300
370 380 390 400 410
pF1KE1 --PRAHRMPFLEAAGHKLGAKKEGV-GGP-ADYHALGAMEVICNSMAKTLQTALQPPDWL
: ::. . ...: . :...... ..: ::. ::.::::.. . : : : ::
CCDS14 RGDRFHRVLLAHGVGARPGGQSRALPAAPRADFFLTGALEVICEAWLRDLLFARGAPAWL
310 320 330 340 350 360
420 430 440 450 460 470
pF1KE1 QGHYLVVRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSG-SSSKPFVVSARN
. .:: .:::::: .: :::. : :: . .. :::::: :.. ....:: .:::.
CCDS14 RRRYLRLRYEDLVRQPRAQLRRLLRFSGLRALAALDAFALNMTRGAAYGADRPFHLSARD
370 380 390 400 410 420
480 490 500 510 520 530
pF1KE1 ATQAANAWRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
: .:..::: :. .:..::: : : .:.: : : ::
CCDS14 AREAVHAWRERLSREQVRQVEAACAPAMRLLAYPR--SGEEGDAEQPREGETPLEMDADG
430 440 450 460 470 480
CCDS14 AT
>>CCDS7312.1 CHST3 gene_id:9469|Hs108|chr10 (479 aa)
initn: 483 init1: 178 opt: 416 Z-score: 315.6 bits: 67.9 E(32554): 2.9e-11
Smith-Waterman score: 589; 29.9% identity (61.3% similar) in 375 aa overlap (161-527:130-472)
140 150 160 170 180 190
pF1KE1 AAVGAAPAAAAGMAGVAAPPGNGTRGTGGVGDKRQLVYVFTTWRSGSSFFGELFNQNPEV
: .:... . :: :.:::: ::.:::. ..
CCDS73 QLGVEPAMEAAGEEEEEQRKEEEPPRPAVAGPRRHVLLMATT-RTGSSFVGEFFNQQGNI
100 110 120 130 140 150
200 210 220 230 240
pF1KE1 FFLYEPVWHVWQ--KLYPGDAVSLQGAA---RDMLSALYRCDLSVFQLY-SPAGSGGRNL
:.:.::.::. . .. :: : . :.: ::.:. :. ::: :.. . .: .:
CCDS73 FYLFEPLWHIERTVSFEPGGA-NAAGSALVYRDVLKQLFLCDLYVLEHFITPLPED--HL
160 170 180 190 200 210
250 260 270 280 290 300
pF1KE1 TTLGIFGAATNKVVCSSPLCPAYRKEVVGLVDDRVCK--KCPPQRLARFEEECRKYRTLV
: . .: .... .: .:.: . :.: . :: .: : .. : ::. . ..
CCDS73 TQF-MFRRGSSRSLCEDPVCTPFVKKV---FEKYHCKNRRCGPLNVTLAAEACRRKEHMA
220 230 240 250 260 270
310 320 330 340 350 360
pF1KE1 IKGVRVFDVAVLAPLLRDPALDLKVIHLVRDPRAVASSRIRSRHGLIRESLQVVRSRDPR
.:.::. .. : :: .:: :::.::.:::::::: .::. . : . .
CCDS73 LKAVRIRQLEFLQPLAEDPRLDLRVIQLVRDPRAVLASRMVAFAGKYKTWKK--------
280 290 300 310 320
370 380 390 400 410 420
pF1KE1 AHRMPFLEAAGHKLGAKKEGVGGPADYHALGAMEVICNSMAKTLQTALQPPDWLQGHYLV
.:. :. : ..: : .. :.:. . . .:. : ::.:.:..
CCDS73 -----WLDDEGQD-GLREEEVQ---------RLRGNCESIRLSAELGLRQPAWLRGRYML
330 340 350 360
430 440 450 460 470 480
pF1KE1 VRYEDLVGDPVKTLRRVYDFVGLLVSPEMEQFALNMTSGSGSSSKPFVVSARNATQAANA
:::::.. :.. :..: :.:. ..:..:.. . :... ..: . . .:... .
CCDS73 VRYEDVARGPLQKAREMYRFAGIPLTPQVEDWIQKNTQAAHDGSGIYS-TQKNSSEQFEK
370 380 390 400 410 420
490 500 510 520 530
pF1KE1 WRTALTFQQIKQVEEFCYQPMAVLGYERVNSPEEVKDLSKTLLRKPRL
:: .. :. . :. : : ..::. . . . . : .::..
CCDS73 WRFSMPFKLAQVVQAACGPAMRLFGYKLARDAAALTNRSVSLLEERGTFWVT
430 440 450 460 470
530 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 17:41:15 2016 done: Sun Nov 6 17:41:16 2016
Total Scan time: 3.360 Total Display time: 0.020
Function used was FASTA [36.3.4 Apr, 2011]